我们介绍了声学场景和事件的检测和分类的任务描述(DCASE)2022挑战任务2:“用于应用域通用技术的机器状况监控的无监督异常的声音检测(ASD)”。域转移是ASD系统应用的关键问题。由于域移位可以改变数据的声学特征,因此在源域中训练的模型对目标域的性能较差。在DCASE 2021挑战任务2中,我们组织了一个ASD任务来处理域移动。在此任务中,假定已知域移位的发生。但是,实际上,可能不会给出每个样本的域,并且域移位可能会隐含。在2022年的任务2中,我们专注于域泛化技术,这些技术检测异常,而不论域移动如何。具体而言,每个样品的域未在测试数据中给出,所有域仅允许一个阈值。我们将添加挑战结果和挑战提交截止日期后提交的分析。
translated by 谷歌翻译
Transparency of Machine Learning models used for decision support in various industries becomes essential for ensuring their ethical use. To that end, feature attribution methods such as SHAP (SHapley Additive exPlanations) are widely used to explain the predictions of black-box machine learning models to customers and developers. However, a parallel trend has been to train machine learning models in collaboration with other data holders without accessing their data. Such models, trained over horizontally or vertically partitioned data, present a challenge for explainable AI because the explaining party may have a biased view of background data or a partial view of the feature space. As a result, explanations obtained from different participants of distributed machine learning might not be consistent with one another, undermining trust in the product. This paper presents an Explainable Data Collaboration Framework based on a model-agnostic additive feature attribution algorithm (KernelSHAP) and Data Collaboration method of privacy-preserving distributed machine learning. In particular, we present three algorithms for different scenarios of explainability in Data Collaboration and verify their consistency with experiments on open-access datasets. Our results demonstrated a significant (by at least a factor of 1.75) decrease in feature attribution discrepancies among the users of distributed machine learning.
translated by 谷歌翻译
Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.
translated by 谷歌翻译
我们已经开发了带有被动动态步行机制的双头机器人。这项研究提出了一个指南针模型,其摇摆质量连接到上半身,并沿水平方向振荡,以阐明上半身水平动力学对两足动物行走的影响。该模型的极限周期进行了数值搜索,并研究了它们的稳定性和能源效率。根据支持摇摆质量的弹簧常数,获得了几个不同的极限周期。特定类型的解决方案降低了稳定性,同时降低了意外下降并提高能源效率的风险。获得的结果归因于摇摆的质量朝与上半身相反的方向移动,从而防止行走时加速和减速的大幅变化。研究了所提出的模型的运动与实际的双头机器人与人类步态之间的关系。
translated by 谷歌翻译
虽然减少方差方法在解决大规模优化问题方面取得了巨大成功,但其中许多人遭受了累积错误,因此应定期需要进行完整的梯度计算。在本文中,我们提出了一种用于有限的和非convex优化的单环算法(梯度估计器的单环方法),该算法不需要定期刷新梯度估计器,但实现了几乎最佳的梯度复杂性。与现有方法不同,雪橇具有多功能性的优势。 (i)二阶最优性,(ii)PL区域中的指数收敛性,以及(iii)在较小的数据异质性下较小的复杂性。我们通过利用这些有利的特性来构建有效的联合学习算法。我们展示了输出的一阶和二阶最优性,并在PL条件下提供分析。当本地预算足够大,并且客户少(Hessian-)〜异质时,该算法需要较少的通信回合,而不是现有方法,例如FedAvg,脚手架和Mime。我们方法的优势在数值实验中得到了验证。
translated by 谷歌翻译
多源数据融合,共同分析了多个数据源以获得改进的信息,引起了广泛的研究关注。对于多个医疗机构的数据集,数据机密性和跨机构沟通至关重要。在这种情况下,数据协作(DC)分析通过共享维数减少的中间表示,而无需迭代跨机构通信可能是合适的。在分析包括个人信息在内的数据时,共享数据的可识别性至关重要。在这项研究中,研究了DC分析的可识别性。结果表明,共享的中间表示很容易识别为原始数据以进行监督学习。然后,这项研究提出了一个非可读性可识别的直流分析,仅共享多个医疗数据集(包括个人信息)的非可读数据。所提出的方法基于随机样本排列,可解释的直流分析的概念以及无法重建的功能的使用来解决可识别性问题。在医学数据集的数值实验中,提出的方法表现出非可读性可识别性,同时保持了常规DC分析的高识别性能。对于医院的数据集,提出的方法在仅使用本地数据集的本地分析的识别性能方面表现出了9个百分点的改善。
translated by 谷歌翻译
在本文中,我们通过使用实例分割来生成更尖锐的注意图以进行动作识别,提出了注意分支网络(ABN)的扩展。视觉解释的方法(例如Grad-CAM)通常会产生模糊的地图,这些图对人类的理解不是直观的,尤其是在识别视频中人们的行为时。我们提出的方法ABN通过引入新的面膜丢失来解决此问题,该掩模损失使生成的注意图接近实例分割结果。此外,引入了PC丢失和多个注意图,以增强地图的清晰度并提高分类的性能。UCF101和SSV2的实验结果表明,通过所提出的方法生成的地图在定性和定量上比原始ABN的图更清晰。
translated by 谷歌翻译
人类可以从语言描述中获取新颖的视觉概念知识,因此我们使用少量图像分类任务来研究机器学习模型是否可以具有此功能。我们提出的模型Lide(从图像和描述中学习)具有文本解码器来生成描述和文本编码器,以获取机器或用户生成的描述的文本表示。我们证实,带有机器生成的描述的LIDE优于基线模型。此外,通过高质量的用户生成的描述进一步提高了性能。生成的描述可以看作是模型预测的解释,我们观察到这种解释与预测结果一致。我们还研究了为什么语言描述通过比较图像表示形式和特征空间中的文本表示来改善了几张图像分类性能。
translated by 谷歌翻译
最近,许多作品探索了SIM到真实传递的可传递视觉模型预测性控制(MPC)。但是,这样的作品仅限于一次性转移,必须收集一次现实世界的数据才能执行SIM到实现的传输,这仍然是一项重大的人类努力,在将模拟中学到的模型转移到真实的新域中所学的模型世界。为了减轻这个问题,我们首先提出了一个新型的模型学习框架,称为Kalman随机到典型模型(KRC模型)。该框架能够从随机图像中提取与任务相关的内在特征及其动力学。然后,我们建议使用KRC模型的Kalman随机到典型模型预测控制(KRC-MPC)作为零射击的SIM到真实转移视觉MPC。通过仿真和现实世界中的机器人手和模拟中的块配合任务,通过机器人手通过机器人手来评估我们方法的有效性。实验结果表明,KRC-MPC可以以零拍的方式应用于各种真实域和任务。
translated by 谷歌翻译
如今,为了改善服务和城市地区的宜居性,全世界正在进行多个智能城市计划。 SmartSantander是西班牙桑坦德市的一个智能城市项目,该项目依靠无线传感器网络技术在城市内部部署异质传感器,以测量多个参数,包括户外停车信息。在本文中,我们使用SmartSantander的300多个户外停车传感器的历史数据研究了停车场可用性的预测。我们设计了一个图形模型,以捕获停车场的定期波动和地理位置。为了开发和评估我们的模型,我们使用了桑坦德市的3年停车场可用性数据集。与现有的序列到序列模型相比,我们的模型具有很高的精度,该模型足够准确,可以在城市提供停车信息服务。我们将模型应用于智能手机应用程序,以被公民和游客广泛使用。
translated by 谷歌翻译